AI资讯新闻榜单内容搜索-claude 3

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Karpathy发出灵魂拷问，评估AI究竟该看哪些指标？答案或许就藏在经典游戏里！最近，加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体，Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯

8247 点击 2025-03-03 16:00

这份提示词有很多哲学性思考，很多表达让我看到背后的设计者把claude当成一个人去设计。　我猜，应该是Amanda Askell（Anthropic负责alignment和character design，是学哲学的一位女生，也是我的榜样) 主要设计的。　

来自主题: AI技术研报

8979 点击 2025-03-02 10:22

斯坦福和普林斯顿研究者发现，DeepSeek-R1生成的自定义CUDA内核，完爆了o1和Claude 3.5 Sonnet，拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线，但GPU编程加速自动化的按钮，已经被按下！

来自主题: AI技术研报

11555 点击 2025-02-27 16:17

昨天，Claude 3.7 Sonnet 正式发布。根据目前的各项测评，这个模型可以说是全宇宙最好的代码生成模型，超越了 DeepSeek R1 和 OpenAI 的 o3 等模型。如果你是程序员，一定要第一时间切换过去，用下这款模型。

来自主题: AI资讯

7319 点击 2025-02-27 09:54

Claude 3.7 Sonnet制作的游戏中，贪吃蛇居然惊现自我意识，甚至经历了一场存在主义危机！它开始思考：我是谁？我在这里做什么？网友们大受震撼：要是游戏里有这样的NPC，那就绝了。

来自主题: AI资讯

7546 点击 2025-02-26 20:12

Claude 3.7新鲜出炉全网热议，到底有多强？第一波实测来了！简单粗暴总结，它在编程、现实世界任务上，能力爆表。只需一个样本，就能一下子吐出3200多行代码，做出一个可玩性很高的游戏。

来自主题: AI产品测评

11774 点击 2025-02-25 20:44

当地时间 2 月 25 日，Anthropic 正式发布了 Claude 3.7 Sonnet，“这是迄今为止我们最智能的模型，也是市场上首个混合推理模型。”Anthropic 官方表示。

来自主题: AI技术研报

6963 点击 2025-02-25 15:09

Claude深夜重磅发布新模型——

来自主题: AI技术研报

8734 点击 2025-02-25 11:08

就在刚刚，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSeek R1，AI编码王者出世了。

来自主题: AI资讯

10508 点击 2025-02-25 08:53

OpenAI刚刚发布SWE-Lancer编码基准测试，直接让AI模型挑战真实外包任务！这些任务总价值高达100万美元。有趣的是，测试结果显示，Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。

来自主题: AI技术研报

9383 点击 2025-02-19 15:19